录屏视频：在 Python 里进行模型诊断—

在 Python 里进行模型诊断

这里是逻辑回归 sklearn 包的相关文献，另外，这里是处理混淆矩阵的相关文献。

在这个视频结尾，wikipedia 中的文档实际上与 sklearn 的输出相反。预测结果位于纵列中，而实际结果位于行中。因此，

	Predicted （预测值）
Actual（实际值）	0	1
0	23	1
1	14	2

因此，在我们预测的未入学人数中，有 23 人未入学。
在我们预测的未入学人数中，有 14 人已入学。
在我们预测的已入学人数中，有 1 人未入学。
在我们预测的已入学人数中，有 2 人已入学。

为什么使用训练测试拆分法以及一些附加文献

这里是 sklearn 逻辑回归的文献。这里是混淆矩阵的参考文献。

在这个视频中，你创建了一个训练测试数据集，这在机器学习中十分常见。一般来说，将数据拆分为训练数据与测试数据是一种十分有效的方法，这不仅能保证你的模型可以准确预测拟合的数据，也能预测它从未见过的数据。一旦证明你的模型能够准确预测测试数据，就可以确保它在其他预测案例中也能表现出色，比如预测未来的学生或是交易状况等等。